דף הבית  >> 
 >> 

הרשם  |  התחבר


OCR - מגוון רחב של אפשרויות 

מאת    [ 15/05/2010 ]

מילים במאמר: 358   [ נצפה 2113 פעמים ]

על ידי כך התוכנה לומדת את השגיאות האישיות ומקטינה את סיכוייהן להופיע שוב בעתיד. במידה והתוכנה לזיהוי תווים אופטי היא כזו שמזהה מילים, ניתן להקטין את כמות השגיאות בזיהוי התווים השונים, על ידי בדיקת המילה הנבחרת בתוכן עצמו.

זיהוי תווים אופטי - OCR יכול להתבצע בשתי דרכים:
·         תיאור מבנה - על ידי חילוק האות לחלקים שונים, ה-OCR יודע ליצור תיאור של החלקים השונים שנוצרו, ובכך ליצור יחסים ביניהם.
·         התאמת תבנית – ה OCR שומר בתוכו תבניות קבועות של אותיות (כיצד הן אמורות להראות), ולאחר הסריקה מתבצעת בדיקה איזה מבין התווים שנסרקו תואמים לתבניות ששמורות בתוכו.

 
הערה: בתהליך הזיהוי שמבצע ה-OCR , נוצר לעתים מצב שבו ישנם מספר תווים שגויים, או ליתר דיוק, נוצרת אי התאמה בין זיהוי ה-OCR לבין התוצר הסופי- קובץ דיגיטאלי של המסמך. על מנת למנוע עד כמה שניתן את השגיאות הללו, מפעילה המערכת הממוחשבת בדיקה מול מילון. במקרים אלו התוכנה מכילה את האפשרות ליצור הקשרים בין התווים השונים ולבנות מילים שלמות. במקרה שה-OCR לא מוצא מילה כלשהי במילון, הוא משנה תווים מסוימים על מנת להגיע להקשר לוגי, עד למציאת המילה הנכונה המופיעה במילון.

תהליך סריקת מסמכים זיהוי תווים אופטי - OCR מתבצע בשבעה שלבים:
·         עקב קיום אלגוריתם מתוחכם המסוגל לזהות מאפיינים ותצורות של פונטים שונים, התוכנה מזהה את הפונט שבו הטקסט המקורי הודפס. בעקבות כך בוחרת התוכנה את הגופן שהכי תואם לפונט של הטקסט המקורי.
·         כאשר נסרק מסמך לתוך התוכנה (OCR), נמחק הקידוד באופן אוטומטי על מנת לנקות את המסמך מ"לכלוך" מיותר. ניקוי זה מקל על זיהוי התווים וההפיכה לאותיות.
·         התוכנה מפרידה את השורות השלמות על פי המרווחים השונים לאותיות ומילים.
·         התוכנה מזהה את שורות הטקסט ומיישרת אותם כך שהאותיות תהיינה אופקיות. שלב זה פותר את בעיית הדפים שנסרקו בזווית שמקשה על התוכנה לזהות את האותיות בצורתם הנכונה.
·         התוכנה מזהה את האותיות הבודדות לפי פרמטרים שונים ועל ידי כך מפרידה בין האותיות בהתאם לפונט הנבחר.
·         כיוון שהתוכנה יודעת לזהות טקסט מקורי משולב עם תמונות, יש באפשרותה להפוך אותו לקובץ דיגיטאלי עם תמונות בדומה למקור.
·         לאחר זיהוי התווים והפיכתם למילים בשפה בה נכתב הטקסט, התוכנה מחפשת התאמה מדויקת של כל המילים בלי יוצא מן הכלל בין הטקסט המתורגם למילון עצמו.

טומקס פתרונות סריקה


http://www.tomax.co.il




מאמרים חדשים מומלצים: 

חשיבות היוגה לאיזון אורח חיים יושבני  -  מאת: מיכל פן מומחה
היתרונות של עיצוב בית בצורת L -  מאת: פיטר קלייזמר מומחה
לגלות, לטפח, להצליח: חשיבות מימוש פוטנציאל הכישרון לילדים עם צרכים מיוחדים -  מאת: עמית קניגשטיין מומחה
המדריך לניהול כלכלת משק בית עם טיפים ועצות לניהול תקציב -  מאת: נדב טל מומחה
חשבתם שרכב חשמלי פוטר מטיפולים.. תחשבו שוב -  מאת: יואב ציפרוט מומחה
מה הסיבה לבעיות האיכות בעולם -  מאת: חנן מלין מומחה
מערכת יחסים רעילה- איך תזהו מניפולציות רגשיות ותתמודדו איתם  -  מאת: חגית לביא מומחה
לימודים במלחמה | איך ללמוד ולהישאר מרוכז בזמן מלחמה -  מאת: דניאל פאר
אימא אני מפחד' הדרכה להורים כיצד תוכלו לנווט את קשיי 'מצב המלחמה'? -  מאת: רזיאל פריגן פריגן מומחה
הדרך שבה AI (בינה מלאכותית) ממלאת את העולם בזבל דיגיטלי -  מאת: Michael - Micha Shafir מומחה

מורנו'ס - שיווק באינטרנט

©2022 כל הזכויות שמורות

אודותינו
שאלות נפוצות
יצירת קשר
יתרונות לכותבי מאמרים
מדיניות פרטיות
עלינו בעיתונות
מאמרים חדשים

לכותבי מאמרים:
פתיחת חשבון חינם
כניסה למערכת
יתרונות לכותבי מאמרים
תנאי השירות
הנחיות עריכה
תנאי שימוש במאמרים



מאמרים בפייסבוק   מאמרים בטוויטר   מאמרים ביוטיוב